메뉴

#코딩 AI

HN
Hacker News 11일 전
IMP 9

구글 제미나이 3.5, 에이전트 행동 수행 능력 강화

구글 딥마인드가 최신 AI 모델 패밀리인 제미나이 3.5를 공개하며, 첫 모델로 고성능 에이전트 및 코딩 작업에 특화된 3.5 Flash를 출시했습니다. 이번 모델은 기존 대비 4배 빠른 속도를 제공하면서도 복잡한 다단계 에이전트 워크플로와 멀티모달 이해도에서 최고 수준의 성능을 기록하는 것이 핵심입니다. 또한 '안티그래비티(Antigravity)' 플랫폼과 결합하여 개발 및 엔터프라이즈 환경에서 실질적인 업무 자동화 및 문제 해결을 대규모로 수행할 수 있습니다.

제미나이 3.5 에이전트 코딩 AI
TD
The Decoder 12일 전
IMP 9

커서, 오픈AI·앤스로픽 대적 저렴한 AI 모델 공개

AI 코딩 플랫폼 커서(Cursor)가 자체 모델인 'Composer 2.5'를 공개했습니다. 이 모델은 최고수준인 오픈AI의 GPT-5.5 및 앤스로픽의 Opus 4.7과 맞먹는 벤치마크 성능을 제공하면서도 가격은 턱없이 저렴해 실무 개발자들에게 훌륭한 대안이 될 수 있습니다. 또한, 커서는 스페이스X와 손잡고 처음부터 10배 규모의 연산량을 투입해 훨씬 더 큰 후속 모델을 학습 중인 것으로 전해졌습니다.

커서(Cursor) 코딩 AI 가격 경쟁력
HN
Hacker News 29일 전
IMP 9

우버, 2026년 AI 예산 단 4개월 만에 전량 소진

우버가 엔지니어들의 압도적인 도입으로 인해 2026년 연간 AI 예산을 단 4개월 만에 모두 소진했습니다. 현재 전체 엔지니어의 95%가 매달 AI 도구를 사용 중이며, 작성되는 코드의 70%가 AI에서 생성될 정도로 도구의 활용도가 폭발적입니다. 이는 개발자 생산성을 위한 AI 도구의 가치가 기존 예산 산정 기준을 뛰어넘을 만큼 매우 높아졌음을 시사합니다.

AI 예산 클로드 코드 우버
LL
r/LocalLLaMA 34일 전
IMP 8

SWE-bench, 오염으로 사실상 한계 도달

오래전부터 코딩 AI 성능의 표준이었던 벤치마크 SWE-bench Verified가 데이터 오염 문제와 불량 테스트 케이스로 인해 최신 프론티어 모델의 코딩 능력을 더 이상 제대로 측정하지 못한다는 분석이 나왔습니다. 평가 데이터가 모델 학습에 노출되어 실력 향상이 아닌 사전 지식 암기로 점수가 올라가는 문제가 발생하고 있습니다. 이에 따라 업계는 새로운 대체 평가 지표인 SWE-bench Pro 사용을 권장하고 있습니다.

벤치마크 오염 코딩 AI SWE-bench
TD
The Decoder 37일 전
IMP 8

앤스로픽, 클로드 코드 품질 저하 사과

최근 한 달간 지속된 코딩 에이전트 '클로드 코드(Claude Code)'의 품질 저하 문제에 대해 앤스로픽이 공식 사과 및 원인을 발표했습니다. 회사는 추론 깊이 축소, 캐싱 최적화 버그, 시스템 프롬프트 길이 제한 등 3가지 독립적인 오류를 원인으로 지목하고 이를 모두 해결했습니다. 재발 방지를 위해 내부 테스트를 강화하고, 피해를 입은 모든 구독자의 사용량 한도를 초기화하는 보상 조치를 취했습니다.

앤스로픽 클로드 코드 품질 관리
TC
TechCrunch AI 39일 전
IMP 9

스페이스X, 커서(Cursor)와 손잡고 600억 달러 인수 옵션 확보

스페이스X는 차세대 '코딩 및 지식 노동 AI' 개발을 위해 인기 코딩 플랫폼 커서(Cursor)와 파트너십을 체결했습니다. 이 계약에는 올해 하반기 커서를 600억 달러에 인수할 수 있는 옵션과 100억 달러의 작업료 지급 조항이 포함되어 있어 업계에 큰 반향을 일으키고 있습니다. 이는 일론 머스크의 기술 제국 확장과 xAI의 컴퓨팅 파워 결합, 그리고 오픈AI 등과의 코딩 AI 시장 주도권 경쟁을 위해 추진된 전략적 행보로 풀이됩니다.

스페이스X 커서(Cursor) 인수합병(M&A)
HN
Hacker News 39일 전
IMP 7

클로드 코드, 신규 월 20달러 프로 요금제에서 제외

앤스로픽이 AI 코딩 도구인 '클로드 코드(Claude Code)'를 월 20달러 프로(Pro) 요금제 신규 가입자에게서 제외하는 실험을 진행하고 있습니다. 이는 구독 기반 사용량 제한 방식에서 API 토큰 기반 종량제로 전환하려는 비용 절감 및 수익화 정책의 일환으로 풀이됩니다. 기존 프로 및 맥스(Max) 구독자들은 이번 변경 사항의 영향을 받지 않습니다.

Anthropic 클로드 코드 요금제 정책
TD
The Decoder 44일 전
IMP 8

앤스로픽 클로드 4.7, 코딩 대폭 향상 및 보안 능력 축소

앤스로픽이 자율적 코딩 능력과 이미지 해상도를 대폭 향상한 '클로드 오푸스 4.7'을 출시했습니다. 이 모델은 코딩 벤치마크에서 64.3%를 기록하며 전작 대비 큰 성능 향상을 보여주지만, 악용을 막기 위해 사이버 보안 공격 관련 능력은 의도적으로 축소 및 통제했습니다. 단, 새로운 토크나이저 도입으로 인해 실제 사용 비용이 최대 35% 증가할 수 있어 사용자의 주의가 필요합니다.

앤스로픽 클로드 코딩 AI
MR
MIT Tech Review 47일 전
IMP 8

AI에 대한 평가가 극명하게 엇갈리는 이유

스탠퍼드 대학의 연례 AI 보고서는 미국의 압도적인 데이터센터 인프라와 TSMC에 의존하는 공급망의 취약성 등 핵심 통계를 제시합니다. 특히 최근 AI 생태계의 가장 큰 특징은 전문가와 일반 대중 간의 인식 격차가 매우 크다는 점입니다. 코딩 등 기술적 작업에 매일 최신 AI를 사용하는 파워 유저는 기술의 발전에 압도되지만, 일반적인 용도로 무료 버전을 사용하는 대중은 여전히 어리석은 실수를 하는 AI에 실망하는 등 사용 경험의 차이가 극명한 갈림길에 서 있습니다.

AI 인식 격차 스탠퍼드 AI 보고서 코딩 AI
TD
The Decoder 51일 전
IMP 8

LLM, 코딩·수학은 완벽하지만 단순한 질문엔 말문 막히는 이유

안드레이 카르파시(Andrej Karpathy)는 최신 AI 모델이 복잡한 코딩과 수학 문제를 완벽히 해결하면서도 단순한 일상적인 질문에는 엉뚱한 대답을 하는 현상에 대해 설명했습니다. 그 이유는 강화 학습을 통해 결과를 명확하게 검증할 수 있는 분야(코딩, 수학)에서는 AI의 발전이 압도적으로 빠르기 때문입니다. 이는 검증 가능성(Verifiability)이 향후 AI의 발전 속도와 자동화의 범위를 결정하는 핵심 요소임을 시사합니다.

인공지능 안드레이 카르파시 강화 학습